Sessão sobre Sistema Quarto, RStudio, Linguagem R e Git/GitHub
Conheça e Utilize o Terminal Git Bash
Apresentações
Sobre o Professor
Washington Santos da Silva
Formação Acadêmica
Doutorado em Estatística e Experimentação Agropecuária (UFLA)
Mestrado em Estatística e Experimentação Agropecuária (UFLA)
Graduação em Ecomomia (UFMG)
Áreas de Interesse
Estatística e Econometria Aplicadas
Análise de Séries Temporais
Inferência Bayesiana
Experiência Profissional
Longa carreira na administração pública federal
Sobre Vocês
Breve apresentação
Por favor, se apresentem e expliquem seus objetivos ao cursar esta disciplina.
Apresentação da Disciplina
Por quê?
Motivação
Vamos começar com algumas questões básicas e gerais:
Qual é o objetivo da econometria?
Por que economistas (ou outros profissionais) estudam ou usam econometria?
Uma resposta simples: Para aprender sobre o mundo usando dados.
Aprender sobre o mundo = Formular e responder perguntas, formular e questionar teorias e suposições.
“Mundo das Finanças”
Agenda de Pesquisa em Finanças
Os mercados financeiros incorporam rapidamente e completamente as informações disponíveis? (Testa a hipótese de eficiência informacional dos mercados.)
O modelo CAPM ou os modelos multifatoriais (como o APT) explicam melhor a variação dos retornos dos ativos? (Comparação empírica de modelos de precificação de ativos.)
Quais características das empresas explicam a probabilidade de inadimplência ou default corporativo?
Quais fatores específicos de uma empresa explicam os níveis de ESG (ambiental, social e governança) divulgados por empresas?
Empresas com maior presença de mulheres na liderança apresentam desempenho financeiro superior?
O nível de governança corporativa das empresas está associado a menor custo de capital?
Quais características das empresas determinam a escolha entre financiamento via dívida ou emissão de ações?
“Mundo das Finanças”
Agenda de Pesquisa em Finanças
Quais fatores explicam a decisão de pagar dividendos entre empresas listadas?
Firmas com maior investimento em inovação (R&D) apresentam maior valor de mercado ajustado ao risco?
Quais determinantes explicam os níveis de spread de crédito cobrados em empréstimos corporativos?
Empresas com maior participação de investidores institucionais apresentam menor manipulação contábil?
O que?
O Que um Econometrista Aplicado Precisa Saber?
Um econometrista aplicado† precisa dominar (pelo menos) três áreas:
A Teoria econômica.
A Teoria Estatística/Econométrica (hipóteses, métodos, limitações).
Como aplicar métodos teóricos a dados reais, o que exige conhecimento não trivial da teoria econômica e estatística/econométrica.
Métodos eficientes para análisar dados— aquisição, transformação, junção, sumarização, visualização e modelagem \(\rightarrow\) fluência em linguagens de programação.
Esta disciplina visa aprofundar seu conhecimento nas últimas três áreas.
* importa o arquivo de dadosuse"trade.dta", clear* cria nova variável replace distance = 5 if distance < 5* Cria log das variáveis generate log_trade = log(trade)generate log_distance = log(distance)* Regressão com EPs robustos à heterocedasticidadereg log_trade log_distance, robust
Por que usar a Linguagem R?
Modelo de Regressão em R (base)
# importa o arquivo de dadosdados <- haven::read_dta("trade.dta")# cria nova variáveldados$distance <-ifelse(dados$distance <5, 5, dados$distance)# Regressão linear com EPs robustos à heterocedasticidadem1 <-lm(log(trade) ~log(distance), data = dados)lmtest::coeftest(m1, vcov = sandwich::vcovHC(m1, type ="HC1"))# exibe o resultadosummary(m1)
Por que usar a Linguagem R?
Modelo de Regressão em Julia (Kezdi.jl)
# importa o arquivo de dados@use"trade.dta"# cria nova variável@replace distance =5@if distance <5# Cria log das variáveis @generate log_trade =log(trade)@generate log_distance =log(distance)# Regressão linear com EPs robustos à heterocedasticidade@regress log_trade log_distance, robust
Por que usar a Linguagem R?
Modelo de Regressão em Python
# carrega os módulos necessáriosimport pandas as pdimport mathimport statsmodels.api as smimport statsmodels.formula.api as smf# importa o arquivo de dadosdf = pd.read_stata("trade.dta")# cria nova variáveldf.loc[df["distance"] <5, "distance"] =5# Cria log das variáveis df["log_trade"] = df["trade"].apply(math.log)df["log_distance"] = df["distance"].apply(math.log)# Regressão linear com EPs robustos à heterocedasticidademodelo = smf.ols('log_trade ~ log_distance', data = df).fit(cov_type='HC3')print(modelo.summary())
Por que usar a Linguagem R?
Motivos
1. R é gratuita e código aberto — economizando dinheiro tanto para você quanto para a instituicão 💰💵💰.
2. R é reconhecida e demandada no mercado.
3. R é muito flexível e poderosa—adaptável a quase qualquer tarefa, por exemplo, econometria, análise de dados espaciais, aprendizagem estatística/de máquina, web scraping, limpeza de dados…
4. Eu 💖 R
Nota: Aprender R, e qualquer outra linguagem ou sistema, definitivamente requer tempo e esforço.
Introdução ao RStudio
O que é o RStudio?
Um Ambiente de Desenvolvimento Integrado (Integrated Development Environment, IDE)
Ambiente de desenvolvimento que suporta múltiplas linguagens (R, Python, SQL, C++…), mas é especialmente útil para a linguagem R.
Facilita a escrita de código, gerenciamento de projetos, criação de documentos computacionais (arquivos quarto, scripts, notebooks…)
Integra ferramentas para desenvolvimento, depuração e publicação
Interface do RStudio
Figura 1: Interface do RStudio: 4 Painéis
Interface do RStudio
Painel Superior Esquerdo: - Editor de código - Documentos Quarto (.qmd) - Scripts R (.R)
Painel Inferior Esquerdo: - Console R (execução de comandos) - Terminal (acesso ao sistema)
Painel Superior Direito: - Ambiente (variáveis e objetos) - Histórico de comandos - Conexões - Git (controle de versão)
Pacotes (ou bibliotecas) são coleções organizadas de funções/dados e documentação que estendem as funcionalidades básicas da linguagem R.
Repositórios principais:
CRAN (Comprehensive R Archive Network): repositório oficial com mais de 20.000 pacotes verificados e testados, cobrindo estatística, econometria e ciência de dados
Bioconductor: repositório especializado em bioinformática e análise de dados genômicos, com padrões rigorosos de qualidade e documentação
Instalação de Pacotes R
Usando a função install.packages()
No console R do RStudio (atalho: Ctrl + 2), digite:
install.packages("tidyverse", "here", "fs")
Instalação de Pacotes R
Usando a Guia Packages
Para instalar pacotes usando a guia Packages no RStudio:
Clique na guia Packages.
Clique em Install Packages.
Digite o nome de cada pacote que deseja instalar separados por um espaço ou vírgula na caixa de texto, ou copie os pacotes abaixo e cole na caixa de texto:
tidyverse here fs
Projetos RStudio
O que são projetos RStudio?
Unidades organizacionais para seu trabalho
Cada projeto tem seu próprio diretório de trabalho
Facilita a organização de arquivos relacionados
Permite integração com controle de versão (Git)
Criando um projeto para a disciplina
Por que criar projetos estruturados?
Organização dos arquivos e códigos
Facilidade para compartilhar seu trabalho
Reprodutibilidade das análises
Integração com controle de versão
Prática recomendada
RStudio: Configurações Básicas
1. Definindo Git Bash como terminal padrão
Considerando que você já tenha instalado Git for Windows, siga os passos abaixo:
Clique em Tools → Global Options no menu superior
Clique na aba Terminal, terceira de baixo para cima
Na caixa New terminals open with, selecione Git Bash, em seguida, clique em Apply e depois em OK
Agora, sempre que você abrir um terminal no RStudio, ele será o terminal do Git Bash, que é mais completo e funcional.
Para abrir o terminal, clique na aba Terminal no painel inferior esquerdo do RStudio.
Para verificar se o terminal está funcionando corretamente, digite git --version e pressione Enter. Você deve ver a versão do Git instalada.
RStudio: Configurações Básicas
2. Configurações básicas para Projetos RStudio
Clique em Tools → Global Options no menu superior
Na aba General, desmarque as seguintes opções:
“Restore most recently opened project at startup”
“Restore previously opened files on startup”
“Restore .Rdata into workspace at startup”
Em “Save workspace to .RData on exit”, selecione Never, em seguida, clique em Apply e depois em OK
Nota: A ideia é sempre começar com um ambiente limpo, sem objetos anteriores carregados.
Criando um projeto para a disciplina
Visão Geral
Vamos criar um projeto estruturado para a disciplina
O objetivo é criar uma estrutura padronizada para todos
Criando um projeto para a disciplina
Etapas do Processo
Configurar Git localmente (em sua máquina)
Criar repositório no GitHub
Clonar repositório para sua máquina local
Criar projeto RStudio a partir da pasta clonada
Criar estrutura de pastas e adicionar arquivos
Confirmar que tudo está pronto
Etapa 1: Configuração Local do Git
Configurando o Git Localmente
Antes de começar a usar o Git, é necessário fazer uma configuração inicial básica. Essa configuração identifica quem está fazendo as alterações e só precisa ser feita uma vez em cada computador.
Configure seu nome de usuário: Abra o Git Bash e;
Digite o comando:
git config --global user.name "nome_sobrenome"
Exemplo:
git config --global user.name "maria_silva"
Configure seu email:
Use o mesmo email que você usará (ou já usa) para sua conta no GitHub:
Verifique se a pasta foi criada usando o Windows Explorer.
Etapa 4: Criando um Projeto RStudio
4. Crie um Projeto RStudio usando a Pasta Clonada
Abra o RStudio
Clique em Project → New Project
Selecione Existing Directory
Clique em Browse e navegue até a pasta “visualizacao_dados_2025” que corresponde ao repositório que você acabou de clonar
Selecione a pasta e clique em Open
Clique em Create Project
Projeto Criado!
Etapa 5: Criar Estrutura de Pastas do Projeto
Estrutura do Projeto
Vamos criar um projeto RStudio para a disciplina com a seguinte estrutura:
mpa_ecnt2025/# raíz do projeto ├── atividades # atividades e avaliações├── dados # pasta para arquivos de dados│ ├── brutos # arquivos originais │ └── limpos # dados processados├── mpa_ecnt2025.Rproj # Arquivo do projeto RStudio├── relatorios # relatórios quarto (.qmd)│ ├── 01-relatorio # pasta do relatorio 1└── scripts # scripts R (.R)
Etapa 5: Criando a Estrutura de Pastas do Projeto
Com Git Bash
No terminal do RStudio, na raíz do seu projeto, execute:
Crie a pasta dados:
mkdir dados
Crie as subpastas “brutos” e “limpos”:
mkdir dados/brutosmkdir dados/limpos
Crie a Crie a pasta relatorios:
mkdir relatorios
Crie a subpasta “01-relatorio”
mkdir relatorios/01-relatorio
Crie a pasta “scripts”
mkdir scripts
Crie a pasta “atividades”
mkdir atividades
Etapa 5: Criando a Estrutura de Arquivos do Projeto
Baixe e Adicione o Primeiro Relatório
Acesse a página Cronograma do site da disclina e baixe o arquivo 01-relatorio.zip
Use o Windows Explorer para encontrar o arquivo baixado.
Descompacte o arquivo anterior e copie/recorte o arquivo 01-relatorio.qmd
Salve-o dentro da pasta “relatorios/01-relatorio”
Descompactando arquivos ZIP
Como descompactar arquivos ZIP?
Windows: Clique com o botão direito no arquivo ZIP → Extract All
MacOS: Dê um duplo clique no arquivo ZIP (em versões atuais, um arquivo zip é automaticamente descompactado após o download)
Linux: Clique com o botão direito → Extract Here ou use o comando unzip no terminal
Você pode verificar a estrutura do seu projeto usando a função dir_tree() do pacote fs.
Digite no console R do RStudio:
fs::dir_tree()
Projeto Criado!
Parabéns!!! 👏
Você acaba de criar um projeto estruturado para a disciplina
Esta estrutura organizará nosso trabalho ao longo do semestre
Nos próximos encontros, aprenderemos a utilizar o RStudio,Sistema Quarto, R, Git e GitHub para análise de dados
Arquivo README.md
Definição e importância
É um arquivo de documentação em formato Markdown que serve como porta de entrada para seu repositório.
Normalmente, é o primeiro arquivo que as pessoas visualizam ao acessar seu repositório no GitHub.
Funciona como a “página inicial” do seu projeto, explicando:
O que é o projeto
Como utilizá-lo
Como ele está organizado
Outras informações relevantes
Benefícios para a disciplina:
Documenta seu trabalho de forma organizada
Facilita a avaliação do professor
Serve como portfólio para seu aprendizado
Desenvolve boas práticas de documentação
Como criar um arquivo markdown no RStudio?
Passos
No menu superior do RStudio clique em:
File -> New File -> Markdown File
Salve o arquivo com o nome README.md na raíz do seu projeto RStudio.
Template README.md para seu Projeto
# Mestrado Profissional em Administração ## Disciplina: Econometria Aplicada à Finanças Repositório pessoal da disciplina **Econometria Aplicada à Finanças** (60h) ofertada pelo Mestrado Profissional em Administração do IFMG – Campus Formiga. Este repositório consiste em um projeto RStudio que será utilizado para desenvolver as atividades práticas da disciplina, incluindo a criação de relatórios quarto, scripts R, entre outros.## Estrutura Inicial do Projetompa_ecnt2025/ # pasta raíz do projetp ├── atividades # atividades e avaliações├── dados │ ├── brutos # arquivos originais│ │ └── dados_simulados.csv│ └── limpos # dados processados├── mpa_ecnt2025_testes.Rproj # arquivo do projeto RStudio├── relatorios # relatórios quarto (.qmd)│ └── 01-relatorio│ └── 01-relatorio.qmd└── scripts # scripts R (.R)
README.md = “Diário de bordo”
Como manter seu README atualizado
Atualize o README.md à medida que a disciplina e o seu conhecimeto avançam
Utilize este arquivo como um “diário de bordo” do seu aprendizado
Adicione detalhes sobre desafios superados e soluções encontradas